歌声合成 Vocal Synthesizer
音声合成 Speech Synthesis
の
歌声
版
ボーカルシンセサイザー - Wikipedia
特徴
楽器
としての
歌声
人間の
歌声
と比べて
ロングトーン、ハイトーン、早口などの
歌唱表現
が可能に
作曲
ができるが、
歌唱
できない、人のための
制作支援
仕組み
物理モデル
人間 人
の
生体構造
を
モデル Model
化
声道
や
鼻道
メリット
パラメータ
と
物理量
が直結
直感的に構造が理解しやすい
デメリット
精度を上げるためには、
パラメータ
が膨大に必要
素片連結
音声
を時間領域の波形として表現、断片を連結
メリット
発音
単位では自然な
音声
デメリット
データ量が膨大
接続部が不自然
機械学習 Machine Learning
Deep Learning
評価軸
楽音
歌詞
様々な
楽器
をリアルタイムに切り替えながら演奏
発声タイミング
音符
のタイミングを
母音
に合わせる
音声
音程
、
韻律
芸術
としての美しさ
伸ばし音あるか
ノイズがないか
必要要件
了解性
合成された
歌唱
の
歌詞
が聞き取れるか?
自然性
人間の
歌声
として不自然でないか?
あるとうれしい
息継ぎ
,ゆらぎ
操作感
システム全体として使いやすいか?
既存の
音楽制作
に連携しやすいか?
例
VOCALOID ボーカロイド